AI资讯新闻榜单内容搜索-DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSeek
英伟达良心福利!免费领一年顶级大模型订阅

英伟达良心福利!免费领一年顶级大模型订阅

英伟达良心福利!免费领一年顶级大模型订阅

英伟达良心福利!免费领一年顶级大模型订阅,MiniMax / Kimi / DeepSeek 全都能用!NVIDIA 官方平台build.nvidia.com开放了一批"Free Endpoint"模型,注册账号、验证手机号后就能生成一把最长有效期12 个月的 API Key,免费调用几十个当下最火的大模型——不计 Token、无余额限制、无需信用卡。

来自主题: AI资讯
7902 点击    2026-04-21 09:17
世界引擎:Post-Training开启Physical AGI新纪元

世界引擎:Post-Training开启Physical AGI新纪元

世界引擎:Post-Training开启Physical AGI新纪元

一年前,DeepSeek R1 横空出世,人们才意识到,真正让模型产生推理能力质变的,不必是更大的预训练规模 —— 后训练,用强化学习、过程奖励、闭环反馈,以极低的代价解锁了原本需要数倍算力才能触达的能力边界。

来自主题: AI技术研报
6173 点击    2026-04-20 09:00
DeepSeek深夜更新后自曝:我是V4(?!)

DeepSeek深夜更新后自曝:我是V4(?!)

DeepSeek深夜更新后自曝:我是V4(?!)

不更是不更,一更就是个大动作,DeepSeek V4可能真的要来了!

来自主题: AI资讯
6119 点击    2026-04-08 17:33
北大团队改造DeepSeek注意力,速度快四倍还不丢精度

北大团队改造DeepSeek注意力,速度快四倍还不丢精度

北大团队改造DeepSeek注意力,速度快四倍还不丢精度

就在大家都急头白脸地等待DeepSeek-V4的时候,冷不丁一篇新论文引起了网友们的注意—— 提出新稀疏注意力机制HISA(分层索引稀疏注意力),突破64K上下文的索引瓶颈,相比DeepSeek正在用的DSA(DeepSeek Sparse Attention)提速2-4倍。

来自主题: AI技术研报
7157 点击    2026-04-07 10:30
早于DeepSeek Engram!用「查表」重置Transformer记忆 | ICLR

早于DeepSeek Engram!用「查表」重置Transformer记忆 | ICLR

早于DeepSeek Engram!用「查表」重置Transformer记忆 | ICLR

ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用token索引的embedding表直接读取记忆,彻底解耦记忆容量与计算开销。

来自主题: AI技术研报
8185 点击    2026-03-31 10:04
DeepSeek 崩溃超12小时,工程师连夜抢修,现已恢复正常

DeepSeek 崩溃超12小时,工程师连夜抢修,现已恢复正常

DeepSeek 崩溃超12小时,工程师连夜抢修,现已恢复正常

从3月29日晚21时左右起,国内大模型产品DeepSeek的网页端与APP端服务器持续处于崩溃状态,大量用户反馈无法正常访问对话服务。

来自主题: AI资讯
7893 点击    2026-03-30 09:41
一篇论文引发存储芯片股暴跌,Google 的「DeepSeek 时刻」来了?

一篇论文引发存储芯片股暴跌,Google 的「DeepSeek 时刻」来了?

一篇论文引发存储芯片股暴跌,Google 的「DeepSeek 时刻」来了?

看过 HBO 神剧《硅谷》(Silicon Valley)的朋友,想必都对那个名为 Pied Piper(魔笛手)的虚构公司念念不忘。

来自主题: AI资讯
9711 点击    2026-03-26 15:23
刚刚,被全网猜是DeepSeek V4的神秘大模型,被小米认领了!还能免费“养龙虾”

刚刚,被全网猜是DeepSeek V4的神秘大模型,被小米认领了!还能免费“养龙虾”

刚刚,被全网猜是DeepSeek V4的神秘大模型,被小米认领了!还能免费“养龙虾”

今日凌晨,小米MiMo大模型系列重磅三连更:旗舰基座大模型MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni、MiMo-V2-TTS,其最新发布的这三大模型都是为优化智能体能力打造。

来自主题: AI资讯
8036 点击    2026-03-19 08:55
笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?

笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?

笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?

3月17日,楽天(乐天)集团正式发布了Rakuten AI 3.0模型,号称是“日本国内最大规模的高性能AI模型”。官方宣传的参数量为约7000亿,并且日语特化,Apache 2.0开源许可,还拿了日本经产省和NEDO的GENIAC项目补助。

来自主题: AI资讯
8468 点击    2026-03-17 23:46